|
===================================== 〔語彙分解〕的な部分一致の検索結果は以下の通りです。 ・ modeling : モデリング ・ synthesis : 総合, 統合, 合成, 組み立て, 総合体
Spectral modeling synthesis (SMS; スペクトラルモデリング合成) とは、音声や他の信号のための音響モデリング手法〔 音声認識の統計的手法では、音声を「音響モデル」と「言語モデル」に分離して扱うことが多い。「音響モデル」とは認識対象の音素(もしくは楽音素片)の周波数特性を表したもの、「言語モデル」とは音素の並び方の制約を表したものである。 〕である。 SMSは音を 調波成分 と 残余成分 (非調波成分; ノイズ成分) の組合せとして捉える。 * 調波成分は信号の周波数スペクトラム・ピークで識別され、通常は短時間フーリエ変換 (STFT)で抽出される (sinusoidal modeling)。 * 残余成分、すなわち信号から調波成分を差し引いた残余は、時変フィルタを通したホワイトノイズ 〔加法性ホワイトガウスノイズ (AWGN): パワースペクトル(周波数領域の強度)が全周波数で同じ強度(=白色)で、振幅分布(時間領域の強度)がガウス分布に従うノイズ〕 でモデリングされる (ソース・フィルタモデル)。 モデル全体の出力は、抽出した調波成分の周波数と振幅の組 (sinusoidal model)、および、時変フィルタ係数 (線形予測係数 (LPC) 等) である。 このモデルは直観的に多くのタイプのオーディオ信号に適用できる。例えば音声信号は、声帯振動で生じるゆっくり変化する調波音と、唇や口で生じる広帯域ノイズ状音を含む。同様に楽器も、調波成分と、ノートの発音/変更時に生じるノイズ状音の両方を発する。 == 関連項目 == * 音声符号化 * Sinusoidal modeling (正弦波の総和による調波合成モデル) * Composite sinusoidal model (任意周波数の正弦波の総和による合成モデル) * ソース・フィルタモデル (音声生成モデル) * 適応フィルタ * 線形予測法 * LPC * CELP * フェーズボコーダ * SPEAR - Sinusoidal Partial Editing Analysis and Resynthesis (McAulay-Quatieriアルゴリズム使用) 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Spectral modeling synthesis」の詳細全文を読む スポンサード リンク
|